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RESULT 6 
HUM I RGT 

LOCUS HUM I RGT 2128 bp mRNA linear PRI 06 -JAN- 19 95 

DEFINITION Human insulin-responsive glucose transporter (GLUT 4 ) mRNA, complete 
cds. 

ACCESSION M20747 

VERSION M20747.1 GI : 186552 

KEYWORDS insulin-responsive glucose transporter. 
SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Crania ta; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Homo. 
REFERENCE 1 (bases 1 to 2128) 

AUTHORS Fukumoto,H., Kayano,T., Buse,J.B., Edwards, Y., Pilch, P. F., 

Bell, G.I. and Seino,S. 
TITLE Cloning and characterization of the major insulin-responsive 

glucose transporter expressed in human skeletal muscle and other 
insulin-responsive tissues 
JOURNAL J. Biol. Chem. 264 (14), 7776-7779 (1989) 
PUBMED 2656669 

COMMENT Original source text: Human jejunum and muscle, cDNA to mRNA, 

clones lambda-h- [JHT-3, AMT-6, FMT-1 ] . 

Draft entry and computer-readable sequence for (1] kindly provided 
by G.I. Bell, 19-APR-1989. 
FEATURES Location/Qualifiers 
source 1. .2128 

/organism="Homo sapiens" 
/ mo 1 _ ty pe = " mRNA " 
/db_xref="taxon:9606" 
/map= ,, 17pl3" 
gene 1. .2128 

/gene="GLUT4" 
CDS 146. .1675 

/gene="GLUT4" 

/note="insulin-responsive glucose transporter" 

/codon_start=l 

/protein_id="AAA59189.1" 

/db_xref="GI: 307076" 

/db_xref="GDB:G00-ll 9-997" 

/transla t ion= "MPSGFQQ I GSEDGEPPQQRVTGT LVLAVFSAVLGS LQFGYN I GV 
INAPQKVIEQSYNETWLGRQGPEGPSSIPPGTLTTLWALSVAIFSVGGMISSFLIGII 
SQWLGRKRAMLVNNVLAVLGGSLMGLANAAASYEMLILGRFLIGAYSGLTSGLVPMYV 
GEIAPTHLRGALGTLNQLAIVIGILIAQVLGLESLLGTASLWPLLLGLTVLPALLQLV 
LLPFCPESPRYLYI IQNLEGPARKS LKRLTGWADVSGVLAELKDEKRKLERERPLSLL 
QLLGSRTHRQPLI IAVVLQLSQQLSGINAVFYYSTSIFETAGVGQPAYATIGAGVVNT 
VFT LVS VLL VERAGRRT LHLLGLAGMCGCAI LMT VALLLLERVPAMS YVS I VAI FGFV 
AFFEIGPGPIPWFIVAELFSQGPRPAAMAVAGFSNWTSNFIIGMGFQYVAEAMGPYVF 
LLFAVLLLGFFIFTFLRVPETRGRTFDQISAAFHRTPSLLEQEVKPSTELEYLGPDEN 
D" 

ORIGIN 



Query Match 99.9%; Score 1528.4; DB 8; Length 2128; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1529; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 


i 


ATGCCGTCGGGCTT CCAACAGATAGGCTCCGAAGATGGGGAACCCCCT CAGCAGCGAGTG 


60 






1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 i 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


146 


AT GCCGTCGGGCTT CC AACAGAT AGGCT CCGAAGAT GGGGAACCCC CT CAGC AGCGAGT G 


205 


Qy 


61 


ACTGGGACCCTGGTCCTTGCTGTGTTCTCTGCGGTGCTTGGCTCCCTGCAGTTTGGGTAC 


120 






1 1 1 1 ! 1 1 1 1 II 1 1 1 1 1 I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


206 


ACTGGGACCCTGGTCCTTGCTGTGTTCTCTGCGGTGCTTGGCTCCCTGCAGTTTGGGTAC 


265 


Qy 


121 


AACATT GGGGTC AT CAAT GCCCCTCAGAAGGT GATT GAACAGAGCT AC AATGAGACGT GG 


180 






1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 i 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1! 1 1 1 




Db 


266 


AAC AT T GGGGT CAT CAAT GC CC CT CAGAAGGT GATT GAACAGAGCT AC AATGAGAC GT GG 


325 


Qy 


181 


CTGGGGAGGCAGGGGCCTGAGGGACCCAGCTCCATCCCTCCAGGCACCCTCACCACCCTC 


240 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


326 


CT GGGGAGGC AGGGGC CT GAGGGACCC AGCT C C ATC CCT CC AGGC ACC CT CACC AC C CT C 


385 


Qy 


241 


TGGGCCCTCTCCATGGCCATCTTTTCCGTGGGCGGCATGATTTCCTCCTTCCTCATTGGT 


300 






1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


386 


TGGGCCCTCTCCGTGGCCATCTTTTCCGTGGGCGGCATGATTTCCTCCTTCCTCATTGGT 


445 


Qy 


301 


AT CAT CT CT C AGT GGCTT GGAAGGAAAAGGGC CATGCT GGTCAACAAT GT CCTGGCGGTG 


360 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | 1 | | | M | | | | 




Db 


446 


AT CATCTCTCAGTGGCTT GGAAGGAAAAGGGC CATGCT GGTCAACAAT GT CCTGGCGGTG 


505 


Qy 


361 


CTGGGGGGCAGCCT CATGGGCCTGGCCAACGCTGCT GCCT CCTATGAAAT GCTC AT CCTT 


420 
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inn 1 1 1 1 1 M 1 1 m 1 1 1 1 1 ii linn 

Db 506 CTGGGGGGCAGCCTCATGGGCCTGGCCAACGCTGCTGCCTCCTATGAAATGCTCATCCTT 565 

Qy 421 GGAC GAT T CCT C AT T GGC GCCT ACTC AGGGCT GACAT C AGGGCT GGT GCC CAT GT ACGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I II I I I 

Db 566 GGAC GATT CCT CAT T GGC GC CT ACT C AGGGCT GACAT C AGGGCT GGT GC C CAT GT AC GT G 625 

Qy 481 GGGGAGAT T GCT CC CACT CACCT GCGGGGC GC CCT GGGGACGCT CAAC CAACT GGC CATT 540 

I I I i I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 62 6 GGGGAGAT T GCT CC CACT CACCTGCGGGGC GC CCT GGGGACGCT CAAC CAACT GGC CATT 685 

Qy 541 GT TATCGGCATT CT GATCGCCCAGGT GCTGGGCTTGGAGT CCCT CCT GGGCACT GCCAGC 600 

I | I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I 
Db 686 GT TAT C GGC ATT CT GAT C GCCC AGGT GCTGGGCT T GGAGT C C CT CC T GGGCACT GCC AGC 745 

Qy 601 CTGTGGCCACTGCTCCTGGGCCTCACAGTGCTACCTGCCCTCCTGCAGCTGGTCCTGCTG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 74 6 CT GT GGCC ACT GCT CCTGGGCCTC AC AGTGCT AC CT GC CC T C CT GC AGCT GGT C CT GCT G 805 

Qy 661 CCCTTCTGTCCCGAGAGCCCCCGCTACCTCTACATCATCCAGAATCTCGAGGGGCCTGCC 720 

I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 806 CCCTTCTGTCCCGAGAGCCCCCGCTACCTCTACATCATCCAGAATCTCGAGGGGCCTGCC 865 

Qy 721 AGAAAGAGTCTGAAGC GC CT GACAGGCT GGGCCGAT GTTT CT GGAGTGCT GGCT GAGCTG 780 

MINI t I I I I I I I I I I I I I I I i I II II Ill 

Db 866 AGAAAGAGT C T GAAGC GC CT GACAGGCT GGGC CGAT GT TT CT GGAGT GCT GGCT GAGCT G 925 

Qy 781 AAGGAT GAGAAGCGGAAGCT GGAGCGTGAGCGGCCACT GT CC CT GCT CCAGCTCCT GGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 926 AAGGAT GAGAAGCGGAAGCT GGAGCGT GAGCGGC C ACT GT C C CT GCT C C AGCT C CT GGGC 985 

Qy 841 AGCC GT AC CC AC CGGC AGCC CCTGAT CATT GC GGT C GT GC T GC AGCT GAGC C AGCAGCT C 900 

I I I I I I II I I 1 I I I I I I II I I I I M I I I I I I I I ! 1 1 I I I I I I I I i I I I I I I I I i I M II I 
Db 986 AGCC GT AC CC AC CGGC AGCC CCTGAT CATT GC GGT C GT GC T GC AGCT GAGC C AGC AGCT C 104 5 

Qy 901 T CT GGC AT C AAT GCTGTT TT CT AT T ATT CGAC C AGC AT CT T C GAGAC AGC AGGGGT AGGC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 104 6 TCT GGCAT CAAT GCTGTTTT CT ATTATT CGACCAGC AT CTT C GAGACAGC AGGGGT AGGC 1105 

Qy 961 C AGC CT GC CT AT GC CACC AT AGGAGC T GGT GT GGT CAAC ACAGT CT T C AC CT T GGT CT CG 1020 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1106 C AGC CT GC CT AT GC CACC AT AGGAGCT GGT GT GGT CAAC ACAGT CT T C AC CT T GGT CT C G 1165 

Qy 1021 GT GT T GT T GGT GGAGC GGGC GGGGCGCC GGAC GC T C CAT C T C CT GGGC CT GGC GGGCAT G 1080 

I i I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1166 GT GT T GT T GGT GGAGC GGGC GGGGCGCC GGAC GCT C C AT CT C CT GGGCCT GGC GGGCAT G 1225 

Qy 1081 TGTGGCTGTGCCATCCTGATGACTGTGGCTCTGCTCCTGCTGGAGCGAGTTCCAGCCATG 1140 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 1226 T GT GGCT GT GCC AT CC TGAT GACT GT GGCT CT GCT C CT GCT GGAGC GAGT T C CAGCCAT G 1285 

Qy 1141 AGCT AC GT CT CC AT TGT GGC CATCTT T GGCT T C GT GGCAT x X T T T GAGAT T GGC CCT GGC 1200 

I I II I I I I I I I I I I I I I I I I I I I I I I i I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1286 AGCT AC GT CT CC AT TGT GGC CATCTT T GGCT T C GT GGCAT x X T T T GAGAT T GGC CCT GGC 1345 

Qy 1201 CCCATTCCTTGGTTCATCGTGGCCGAGCTCTTCAGCCAGGGACCCCGCCCGGCAGCCATG 1260 

I II I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 134 6 CCCATTCCTTGGTTCATCGTGGCCGAGCTCTTCAGCCAGGGACCCCGCCCGGCAGCCATG 1405 

Qy 1261 GCTGTGGCTGGTTT CT CC AACT GGAC GAGCAACTT CAT CATTGGCAT GGGTTTCCAGTAT 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1406 GCTGTGGCTGGTTT CTCC AACT GGAC GAGCAACTT CAT CATT GGCAT GGGTT T C C AGT AT 14 65 

Qy 1321 GTTGCGGAGGCTATGGGGCCCTACGTCTTCCTTCTATTTGCGGTCCTCCTGCTGGGCTTC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 66 GTTGCGGAGGCTATGGGGCCCTACGTCTTCCTTCTATTTGCGGTCCTCCTGCTGGGCTTC 1525 

Qy 1381 TT CATCTT CACCTT CT TAAGAGT ACCTGAAACTCGAGGCCGGACGTTT GACCAGATCTCA 1440 

I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I II I I I I I I I II I II I I I I I I I I I I 
Db 1526 TT CAT CTT CACCTT CT TAAGAGT ACCT GAAACT C GAGGCC GGAC GT TT GAC C AGAT CT CA 1585 

Qy 1441 GCTGCCTTCCACCGGACACCCTCTCTTTTAGAGCAGGAGGTGAAACCCAGCACAGAACTT 1500 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1586 GCTGCCTT CCACCGGACACCCT CT CT TTT AGAGC AGGAGGTGAAACCCAGCACAGAACTT 164 5 

Qy 1501 GAGT AT TT AGGGCC AGAT GAGAAC GACT GA 1530 

I I II I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 164 6 GAGT AT TT AGGGCC AGAT GAGAAC GACT GA 167 5 
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RESULT 10 
AEB322 90 

ID AEB32290 standard; cDNA; 2128 BP. 
XX 

AC AEB32290; 
XX 

DT 08-SEP-2005 (first entry) 
XX 

DE Human cDNA #53. 
XX 

KW SNP detection; diagnosis; non-insulin dependent diabetes; obesity; 

KW antidiabetic; anorectic; endocrine disease; gastrointestinal disease; 

KW metabolic disorder; nutritional disorder; gene; ss. 
XX 

OS Homo sapiens. 
XX 

PN US2005147987-A1. 
XX 

PD 07-JUL-2005. 
XX 

PF 19-JUL-2004; 2004US-008933 15 . 
XX 

PR 08-SEP-2000; 2000US-0231 397P . 

PR 10-SEP-2001; 2001US-00948947 . 
XX 

PA (APPL-) APPLERA CORP NY. 
XX 

PI Venter JC, Zhang JN, Liu X, Rowe W, Cravchik A, Kalush F; 

PI Naik A, Subramanian G, Woodage T; 

XX 

DR WPI; 2005-511776/52. 

DR P-PSDB; AEB32351. 
XX 

PT New detection reagent capable of detecting 1, 100, 500, 1000 or 5000 or 

PT more single nucleic acid polymorphisms, useful in identifying an 

PT individual having or at risk of developing type II diabetes or obesity. 

XX 

PS Disclosure; SEQ ID NO 53; 31pp; English. 
XX 

CC The invention relates to a detection reagent capable of detecting one or 

CC more single nucleic acid polymorphisms. The invention also relates to 

CC determining whether a trait is linked to one of the human chromosomes or 

CC its sub-region, a computer readable medium having stored in it the SNP 

CC relational information given in the specification, an isolated nucleic 

CC acid molecule for detecting at least one SNP given in the specification 

CC comprising at least about 12 contiguous nucleotides, genotyping at least 

CC one SNP position given in the specification in a sample, identifying an 

CC individual having or at risk of developing a disorder and a kit 

CC comprising at least one container containing the detection reagent. 

CC Determining whether a trait is linked to one of the human chromosomes or 

CC its sub-region comprises determining whether the trait is linked to one 

CC or more SNPs using the detection reagents. Genotyping at least one SNP 

CC position given in the specification in a sample comprises contacting the 

CC sample with a detection reagent that differentiates between alternative 

CC alleles at at least one SNP position given in the specification, and 

CC determining which allele is present at the at least one SNP position. 

CC Identifying an individual having or at risk of developing a disorder 

CC comprises genotyping at least one SNP given in the specification in a 

CC nucleic acid sample from the individual. The disorder is type II diabetes 

CC (non-insulin dependent diabetes) or obesity. The detection reagent is 

CC useful in identifying an individual having or at risk of developing a 

CC disorder, particularly type II diabetes or obesity. This sequence 

CC represents human cDNA used in the scope of the invention. Note: The 

CC sequence data for this patent did not form part of the printed 

CC specification but was obtained in electronic format from USPTO at 

CC seqdata .uspto.gov/sequence.html . 
XX 

SQ Sequence 2128 BP; 362 A; 663 C; 600 G; 503 T; 0 U; 0 Other; 



Query Match 99.8%; Score 1526.8; 

Best Local Similarity 99.9%; Pred. No. 0; 
Matches 1528; Conservative 0; Mismatches 



DB 14; Length 2128; 

2; Indels 0; Gaps 0; 



Qy 1 AT GCCGTCGGGCTT CC AACAGATAGGCT CCGAAGAT GGGGAACCCCCT CAGCAGCGAGTG 60 

I I I M i I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 6 AT GCCGTCGGGCTT CC AACAGATAGGCT CCGAAGAT GGGGAACCCCCT CAGCAGCGAGTG 205 

Qy 61 ACTGGGACC CT GGT CCTT GCT GTGTT CT CT GC GGT GCT T GGCT C CCTGCAGT TT GGGT AC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I 
Db 206 ACTGGGACCCTGGTCCTTGCTGTGTTCTCTGCGGTGCTTGGCTCCCTGCAGTTTGGGTAC 265 
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Qy 121 AACAT T GGGGT CAT C AAT GC CC CT CAGAAGGT GATT GAAC AGAGCT AC AAT GAGACGT GG 180 

I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I 
Db 266 AACAT T GGGGT CAT C AAT GC CC CT CAGAAGGT GATT GAAC AGAGCT AC AAT GAGACGT GG 325 

Qy 181 CTGGGGAGGCAGGGGCCTGAGGGACCCAGCTCCATCCCTCCAGGCACCCTCACCACCCTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 326 CT GGGGAGGC AGGGGC CT GAGGGACC C AGCT C C ATC CCT CC AGGCACC CT C ACC ACCCT C 385 

Qy 241 TGGGCCCTCTCCATGGCCATCTTTTCCGTGGGCGGCATGATTTCCTCCTTCCTCATTGGT 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I 
Db 38 6 TGGGCCCTCTCCGTGGCCATCTTTTCCGTGGGCGGCATGATTTCCTCCTTCCTCATTGGT 445 

Qy 301 AT CAT C TCTC AGT GGCTT GGAAGGAAAAGGGC CATGCT GGT C AACAAT GT CCT GGCGGT G 360 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 44 6 AT CAT C TCTC AGT GGCTT GGAAGGAAAAGGGC CATGCT GGT C AACAAT GT CCT GGCGGT G 505 

Qy 361 CTGGGGGGCAGCCTCATGGGCCTGGCCAACGCTGCTGCCTCCTATGAAATGCTCATCCTT 4 20 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 506 CTGGGGGGCAGCCTCATGGGCCTGGCCAATGCTGCTGCCTCCTATGAAATGCTCATCCTT 565 

Qy 421 GGAC GATT CC T CAT T GGC GC CT ACT C AGGGCT GACAT C AGGGCT GGTGCC CAT GT ACGTG 480 

I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 566 GGAC GATT CCT CAT T GGC GC CT ACT C AGGGCT GACAT C AGGGCT GGT GCC CATGT ACGT G 625 

Qy 481 GGGGAGATTGCTCCCACTCACCTGCGGGGCGCCCTGGGGACGCTCAACCAACTGGCCATT 540 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I 

Db 626 GGGGAGATTGCTCCCACTCACCTGCGGGGCGCCCTGGGGACGCTCAACCAACTGGCCATT 685 

Qy 541 GTTATCGGCATTCTGATCGCCCAGGTGCTGGGCTTGGAGTCCCTCCTGGGCACTGCCAGC 600 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 

Db 68 6 GT T AT C GGCATT CT GAT C GC CC AGGT GCT GGGCT TGGAGT CCCT C CT GGGCACT GCC AGC 74 5 

Qy 601 CTGTGGCCACTGCTCCTGGGCCTCACAGTGCTACCTGCCCTCCTGCAGCTGGTCCTGCTG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 74 6 CT GT GGCC AC T GCT CCT GGGCC TC AC AGT GCT AC CT GC CC T CCT GC AGCT GGT C CT GC T G 805 

Qy 661 CCCTTCTGTCCCGAGAGCCCCCGCTACCTCTACATCATCCAGAATCTCGAGGGGCCTGCC 7 20 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I 
Db 806 CCCTTCTGTCCCGAGAGCCCCCGCTACCTCTACATCATCCAGAATCTCGAGGGGCCTGCC 8 65 

Qy 721 AGAAAGAGTCTGAAG<:GCCTGACAG<5CTGGGCCGATGTTTCTGGAGTGCTGGCTGAGCTG 780 

I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 866 AGAAAGAGTCTGAAGCGCCT GACAGGCTGGGCCGATGTTT CTGGAGTGCT GGCTGAGCTG 925 

Qy 781 AAGGAT GAGAAGCGGAAGCT GGAGC GT GAGCGGC CACT GT C CCT GCT C C AGCT C CT GGGC 840 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 92 6 AAGGAT GAGAAGCGGAAGCT GGAGCGT GAGCGGC CACT GT CCCT GCTCCAGCTCCT GGGC 985 

Qy 841 AGC C GT AC CC AC CGGC AGCC CCTGAT CAT T GC GGTC GT GCT GC AGC T GAGCC AGCAGCTC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 98 6 AGCC GTACCCACCGGCAGC CCCT GAT CATT GCGGTCGTGCTGCAGCTGAGCCAGCAGCTC 104 5 

Qy 901 TCTGGCATCAATGCTGTTTTCTATTATTCGACCAGCATCTTCGAGACAGCAGGGGTAGGC 960 

I I II II I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I 
Db 104 6 TCTGGCATCAATGCTGTTTTCTATTATTCGACCAGCATCTTCGAGACAGCAGGGGTAGGC 1105 

Qy 961 CAGCCrGCCTATGCCACCATAGGAGCTGGTGTGGTCAACACAGTCTTCACCTTGGTCTCG 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 1106 CAGC CT GC CT AT GC CACC AT AGGAGCT GGT GT GGTC AACACAGT CT T C AC CT T GGT CT C G 1165 

Qy 1021 GT GT T GT T GGT GGAGC GGGC GGGGCGCCGG AC GC T C CAT C T CCT GGGC CT GGCGGGC AT G 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1166 GT GT T GT T GGT GGAGC GGGC GGGGCGCCGGAC GCT C CAT C T CCT GGGC CT GGCGGGCAT G 1225 

Qy 1081 TGTGGCTGTGCCATCCTGATGACTGTGGCTCTG^TCCTGCTGGAGCGAGTTCCAGCCATG 114 0 

I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1226 TGTGGCTGTGCCATCCTGATGACTGTGGCTCTGCTCCTGCTGGAGCGAGTTCCAGCCATG 1285 

Qy 1141 AGCT AC GT CT CC AT TGT GGC CATCTT T GGCTT CGTGGC AT t TTT T GAGAT TGGC CCT GGC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 128 6 AGCT AC GT CT CC AT T GT GGC C ATCTT T GGCT T CGT GGC AT TT TTT GAGAT TGGC CCT GGC 1345 

Qy 1201 CCCATTCCTTGGTTCATCGT GGCC GAGCTCTT CAGC CAGGGACCCCGCCCGGCAGCCATG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 134 6 CCCATTCCTTGGTTCATCGT GGCCGAGCTCTT CAGC CAGGGACCCCGCCCGGCAGCCATG 1405 

Qy 1261 GCTGTGGCTGGTTTCTCCAACTGGACGAGCAACTTCATCATTGGCATGGGTTTCCAGTAT 1320 

I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1406 GCTGTGGCTGGTTTCTCCAACTGGACGAGCAACTTCATCATTGGCATGGGTTTCCAGTAT 14 65 

Qy 1321 GTTGCGGAGGCTATGGGGCCCTACGTCTTCCTTCTATTTGCGGTCCTCCTGCTGGGCTTC 1380 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 


1466 


GT T GCGGAGGCT AT GGGGCCCT AC GT CT T C CT T CT ATT TGCGGT CCT C CT GCT GGGCT TC 


1525 


Qy 


1381 


TT CAT CTT CACCT T CT T AAGAGT ACC T GAAACT C GAGGCC GGACGT TT GACC AGAT CT CA 


1440 




1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1526 


TT CAT CTT CACCTT CTT AAGAGT ACCTGAAACTC GAGGCC GGACGT TT GACC AGAT CT CA 


1585 


Qy 


1441 


GCTGCCTTCCACCGGACACCCTCTCTTTTAGAGCAGGAGGTGAAACCCAGCACAGAACTT 


1500 




1 1 1 1 1 1 1 1 1 1 1 1 1 E 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1586 


GCT GC CTT CC AC CGGACACCCT CT CT TT T AGAGC AGGAGGT GAAAC CC AGC AC AGAACT T 


1645 


Qy 


1501 


GAGTATTTAGGGCCAGATGAGAACGACTGA 1530 






1 I 1 I 1 1 i 1 1 1 1 1 1 1 1 II I 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1646 


GAGTATTTAGGGCCAGATGAGAACGACTGA 167 5 
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RESULT 1 
US-09-591-025-8 

; Sequence 8, Application US/09591025 

; Patent No. 6303373 

; GENERAL INFORMATION: 

; APPLICANT: Bogan, Jonathan S. 

; APPLICANT: Lodish, Harvey F. 

TITLE OF INVENTION: Method of Measuring Plasma Membrane 
; TITLE OF INVENTION: Targeting of GLUT4 
; FILE REFERENCE: 0399.1210-004 
; CURRENT APPLICATION NUMBER: US/09/591,025 
; CURRENT FILING DATE: 2000-06-09 
; PRIOR APPLICATION NUMBER: 60/154,078 
; PRIOR FILING DATE: 1999-09-15 
; PRIOR APPLICATION NUMBER: 60/138,237 
; PRIOR FILING DATE: 1999-06-09 
; NUMBER OF SEQ ID NOS: 8 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 8 

LENGTH: 2592 

TYPE: DNA 

ORGANISM: Artificial Sequence 
FEATURE: 

; OTHER INFORMATION: modified GLUT 4 containing myc tag sequences 
US-09-591-025-8 



Query Match / 86.6%;/ Score 1325; DB 3; Length 2592; 

Best Local Similarity [ 99.6%y Pred. No. 0; 

Matches 1328; Conservative / 0; Mismatches 5; Indels 0; Gaps 0; 



Qy 


195 


GC CT GAGGGACCCAGCTCCATCCCTC CAGGCACC CT CACCACCCT CTGGGCCCT CT CC AT 


254 






If 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 I 1 1 1 1! 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 i 




Db 


510 


GCTTAAGGGACCCAGCTCCATCCCTCCAGGCACCCTCACCACCCTCTGGGCCCTCTCCGT 


569 


Ov 


255 


GGCCATCTTTTCCGTGGGCGGCATGATTTCCTCCTTCCTCATTGGTATCATCTCTCAGTG 


314 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


570 


GGCCATCTTTTCCGTGGGCGGCATGATTTCCTCCTTCCTCATTGGTATCATCTCTCAGTG 


629 


Ov 


315 


GCTT GGAAGGAAAAGGGCCAT GCT GGTCAACAATGT CCTGGCGGTGCT GGGGGGC AGC CT 


374 






1 1 1 1 1 I MINI 1 1 j 1 1 1 1 1 1 1 1 1 1 t 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


630 


GCTT GGAAGGAAAAGGGC CAT GCT GGT C AAC AAT GT CCT GGC GGT GCT GGGGGGC AGC CT 


689 


Qy 


375 


CATGGGCCTGGCCAACGCTGCTGCCTCCTATGAAATGCTCATCCTTGGACGATTCCTCAT 


434 






M 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 II i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 




Db 


690 


CAT GGGCC TGGC C AAC GCT GCT GC CT CCT AT GAAAT GC T CAT CCTT GGAC GATT CCTC AT 


749 


QY 


435 


TGGCGCCT ACTC AGGGCT GACAT C AGGGCT GGTGCCCATGT ACGT GGGGGAGAT TGCT CC 


494 






1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 




Db 


750 


TGGCGCCT ACTC AGGGCT GACATCAGGGCT GGTGCCCATGT ACGT GGGGGAGAT TGCT CC 


809 


Qy 


495 


CACTCACCTGCGGGGCGCCCTGGGGACGCTCAACCAACTGGCCATTGTTATCGGCATTCT 


554 






1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


810 


CACTCACCTGCGGGGCGCCCTGGGGACGCTCAACCAACTGGCCATTGTTATCGGCATTCT 


869 


Qy 


555 


GAT C GC CC AGGT GCT GGGCTT GGAGT C C CT CCTGGGCACT GC CAGCCT GT GGCC AC T GCT 


614 






1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


870 


GAT C GC CC AGGT GCT GGGCT T GGAGT CC CT CCT GGGCACT GC CAGC CT GT GGCC ACTGCT 


929 


Qy 


615 


CCTGGGCCTCACAGTGCTACCTGCCCTCCTGCAGCTGGTCCTGCTGCCCTTCTGTCCCGA 


674 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 




Db 


930 


CCTGGGCCTCACAGTGCTACCTGCCCTCCTGCAGCTGGTCCTGCTGCCCTTCTGTCCCGA 


989 


Qy 


675 


GAGCCCCCGCTACCTCTACATCATCCAGAATCTCGAGGGGCCTGCCAGAAAGAGTCTGAA 


734 






1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


990 


GAGC CC CC GCTACC T CT ACAT CAT CC AGAAT CT C GAGGGGCCT GCC AGAAAGAGT CTGAA 


1049 


Qy 


735 


GC GC CT GACAGGCT GGGC CGAT GT TT CT GGAGT GCT GGCT GAGCT GAAGGAT GAGAAGCG 


794 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1050 


GC GC CT GACAGGCT GGGC CGAT GTTT CT GGAGT GCT GGCT GAGCT GAAGGAT GAGAAGCG 


1109 


Qy 


795 


GAAGCT GGAGCGT GAGCGGCC ACT GT CC CT GCTC C AGC T C CT GGGC AGCC GT AC CC AC CG 


854 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 i I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1110 


GAAGCT GGAGCGTGAGC GGCC ACT GTCCCT GCTC CA GCT CCT GGGC AGCC GT AC CC AC CG 


1169 


Qy 


855 


GC AGCC CCTGAT CATT GCGGT CGT GCTGCAGCTGAGCCAGCAGCTCTCTGGCAT CAAT GC 


914 






1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1170 


GC AGCC CC TGAT CATT GCGGT CGT GCT GCAGCTGAGCC AGCAGCT CT CT GGC AT CAAT GC 


1229 


Qy 


915 


T GTT TT CT AT T ATT CGAC CAGC AT CT T C GAGACAGC AGGGGT AGGCCAGC CT GC CT AT GC 


974 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


1230 


T GTT TT CT AT T ATT CGAC CAGC AT CT T C GAGACAGC AGGGGT AGGCCAGC CT GC CT AT GC 


1289 
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Qy 975 CACC AT AGGAGCT GGT GT GGTC AACAC AGT CT TC ACCT T GGT CT CGGT GT T GTT GGTGGA 1034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1290 CACCATAGGAGCTGGTGTGGTCAACACAGTCTTCACCTTGGTCTCGGTGTTGTT GGTGGA 134 9 

Qy 1035 GCGGGCGGGGCGCCGGACGCTCCATCTCCTGGGCCTGGCGGGCATGTGTGGCTGTGCCAT 1094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1350 GC GGGC GGGGCGC C GGAC GCT C CAT CT C CT GGGC CT GGCGGGC AT GT GT GGCT GTGCC AT 1409 

Qy 1095 CCTGATGACTGTGGCTCTGCTCCTGCTGGAGCGAGTTCCAGCCATGAGCTACGTCTCCAT 1154 

I I I I I I I ( I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1410 CCT GAT GACT GT GGCT CTGCTCCT GCT GGAGCGAGT TCCAGCCATGAGCT ACGT CT CC AT 14 69 

Qy 1155 TGTGGCCATCTTTGGCTTCGTGGCATTTTTTGAGATTGGCCCTGGCCCCATTCCTTGGTT 1214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1470 TGTGGCCATCTTTGGCTTCGTGGCATTTTTTGAGATTGGCCCTGGCCCCATTCCTTGGTT 1529 

Qy 1215 CATCGTGGCCGAGCTCTTCAGCCAGGGACCCCGCCCGGCAGCCATGGCTGTGGCTGGTTT 127 4 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1530 CATCGTGGCCGAGCTCTTCAGCCAGGGACCCCGCCCGGCAGCCATGGCTGTGGCTGGTTT 158 9 

Qy 1275 CTCCAACTGGACGAGCAACTTCATCATTGGCATGGGTTTCCAGTATGTTGCGGAGGCTAT 1334 

II I I I I I I I I I I I I I II I I M I I I II I I I I I I 

Db 1590 CTCCAACTGGACGAGCAACTTCATCATTGGCATGGGTTTCCAGTATGTTGCGGAGGCTAT 164 9 

Qy 1335 GGGGCCCTACGTCTTCCTTCTATTTGCGGTCCTCCTGCTGGGCTTCTTCATCTTCACCTT 1394 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1650 GGGGCCCTACGTCTTCCTTCTATTTGCGGTCCTCCTGCTGGGCTTCTTCATCTTCACCTT 1709 

Qy 1395 CTTAAGAGTACCTGAAACTCGAGGCCGGACGTTTGACCAGATCTCAGCTGCCTTCCACCG 1454 

I I II I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1710 CTTAAGAGTACCTGAAACTCGAGGCCGGACGTTTGACCAGATCTCGGCTGCCTTCCACCG 1769 

Qy 14 55 GACACCCT CT CT TT TAGAGCAGGAGGTGAAACCC AGCACAGAACTTGAGT ATTT AGGGCC 1514 

I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1770 GACACC CT CT CT TT TAGAGCAGGAGGTGAAACCC AGCACAGAACTT GAGT ATTT AGGGCC 1829 

Qy 1515 AGAT GAGAAC GAC 1527 

I I I I I I I I I III 
Db 1830 AGAT GAGAAT GAC 1842 



RESULT 2 

US-09-894-927B-8 

; Sequence 8, Application US/09894 927B 

; Patent No. 6632924 

; GENERAL INFORMATION: 

; APPLICANT: Bogan, Jonathan S. 

; APPLICANT: Lodish, Harvey F. 

; TITLE OF INVENTION: Method of Measuring Plasma Membrane 

; TITLE OF INVENTION: Targeting of GLUT 4 

; FILE REFERENCE: 0399.1210-005 

; CURRENT APPLICATION NUMBER: US/09/8 94 , 927B 

; CURRENT FILING DATE: 2001-06-28 

; PRIOR APPLICATION NUMBER: US 09/591,025 

; PRIOR FILING DATE: 2000-06-09 

; PRIOR APPLICATION NUMBER: US 60/154,078 

; PRIOR FILING DATE: 1999-09-15 

; PRIOR APPLICATION NUMBER: US 60/138,237 

; PRIOR FILING DATE: 1999-06-09 

; NUMBER OF SEQ ID NOS: 9 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 8 

LENGTH: 2592 

TYPE: DNA 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: modified GLUT 4 containing myc tag sequences 
FEATURE: 
NAME /KEY : CDS 
LOCATION: (1)...(2592) 
US-09-894-927B-8 

Query Match 86.4%; Score 1321.8; DB 3; Length 2592; 

Best Local Similarity 99.5%; Pred. No. 0; 

Matches 1326; Conservative 0; Mismatches 7; Indels 0; Gaps 0; 

Qy 195 GCCTGAGGGACCCAGCTCCATCCCTCCAGGCACCCTCACCACCCTCTGGGCCCTCTCCAT 254 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 510 GCTTAAGGGACCCAGCTCCATCCCTCCAGGCACCCTCACCACCCTCTGGGCCCTCTCCGT 569 
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Qy 255 GGCCATCTTTTCCGTGGGCGGCATGATTTCCTCCTTCCTCATTGGTATCATCTCTCAGTG 314 

I I II I I I I I I I I I I I I I I I I I II I i I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 570 GGCCATCTTTTCCGTGGGCGGCATGATTTCCTCCTTCCTCATTGGTATCATCTCTCAGTG 629 

Qy 315 GCTT GGAAGGAAAAGGGC CAT GCT GGT C AACAAT GT CCT GGC GGT GCT GGGGGGCAGC CT 374 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 630 GCTT GGAAGGAAAAGGGC CAT GCT GGT C AACAAT GCT CT GGC GGT GCT GGGGGGCAGC CT 689 

Qy 37 5 CATGGGCCTGGCCAACGCTGCTGCCTCCTATGAAATGCTCATCCTTGGACGATTCCTCAT 4 34 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 690 CATGGGCCTGGCCAACGCTGCTGCCTCCTATGAAATGCTCATCCTTGGACGATTCCTCAT 749 

Qy 435 TGGCGCCTACTCAGGGCTGACATCAGGGCTGGTGCCCATGTACGTGGGGGAGATTGCTCC 4 94 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 750 T GGC GC CT ACTC AGGGCT GAC AT C AGGGCT GGTGCC CAT GT ACGT GGGGGAGAT TGCT CC 809 

Qy 495 CACTCACCTGCGGGGCGCCCTGGGGACGCTCAACCAACTGGCCATTGTTATCGGCATTCT 554 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 810 CACTCACCTGCGGGGCGCCCTGGGGACGCT CAACCAACTGGCCATTGTTATCGGCATT CT 8 69 

Qy 555 GAT C GCCCAGGT GCT GGGCT T GGAGT CCCT CCTGGGCACT GC CAGCCT GT GGCCACT GCT 614 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 870 GAT C GCCCAGGT GCT GGGCT T GGAGT CCCT CCTGGGCACT GCCAGCCT GT GGCCACTGCT 929 

Qy 615 CCTGGGCCTCACAGTGCTACCTGCCCTCCTGCAGCTGGTCCTGCTGCCCTTCTGTCCCGA 674 

II I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 930 CCTGGGCCTCACAGTGCTACCTGCCCTCCTGCAGCTGGTCCTGCTGCCCTTCTGTCCCGA 989 

Qy 675 GAGCCCCC GCTACCTCT ACAT CAT CC AGAATCTC GAGGGGCCTGCCAGAAAGAGT CTGAA 7 34 

I I I I 1 1 1 1 I Ml II I I 1 1 I I I I 1 1 I I I I I I I I II I I I I 1 1 I I 1 1 1 1 1 1 I I 1 1 I I I I I I II 
Db 990 GAGCCCCCGCTACCTCTACATCATCCAGAATCTCGAGGGGCCTGCCAGAAAGAGTCTGAA 104 9 

Qy 735 GC GC CT GACAGGCT GGGC CGAT GT TT CT GGAGT GCT GGCT GAGCT GAAGGAT GAGAAGCG 7 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1050 GCGCCT GACAGGCT GGGCCGAT GTTT CT GGAGTGCT GGCT GAGCT GAAGGAT GAGAAGCG 1109 

Qy 795 GAAGCT GGAGCGT GAGCGGCCACT GT CC CT GC TC C AGCT C CT GGGC AGCC GT AC CC AC CG 854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1110 GAAGCT GGAGCGT GAGC GGCCACT GT C C CT GC TC C AGC T CCT GGGC AGCC GT AC CC AC CG 1169 

Qy 855 GC AGCC CCTGAT C ATT GC GGT CGT GCT GCAGC TGAGCC AGCAGCT C T CT GGC AT CAAT GC 914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I i I I I. I I ! I I II I I I I I 

Db 1170 GC AGCC CCT GAT CATT GCGGT CGT GCT GCAGC T GAGCC AGCAGCT CT CT GGC AT CAAT GC 1229 

Qy 915 T GTT TT CT AT T ATT CGAC C AGC AT CT T C GAGAC AGC AGGGGT AGGCC AGC CT GC CT AT GC 974 

II I I I II I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 1 1 I I I I II I I I I I I M 

Db 1230 TGTTTT CT ATTATT CGACCAGCATCTTCGAGACAGCAGGGGT AGGCCAGCCT GCCT AT GC 1289 

Qy 97 5 C ACC AT AGGAGCT GGT GT GGT C AAC ACAGT CT TC AC CT T GGT CT CGGT GT T GTT GGT GGA 1034 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 1290 C ACC AT AGGAGCTGGT GT GGT C AAC ACAGT CT TC AC CT T GGT CT CGGT GT T GTT GGT GGA 134 9 

Qy 1035 GC GGGC GGGGCGCCGGACGCTCCATCTCCT GGGC CTGGCGGGCATGTGTGGCTGTGCCAT 1094 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I 
Db 1350 GC GGGC GGGGCGCC GGAC GCT CCAT CT C CT GGGC CT GGCGGGCAT GT GT GGCT GT GCC AT 1409 

Qy 1095 CCT GAT GACT GT GGCT CT GCT CCT GCTGGAGCGAGT TCCAGCCAT GAGCT ACGT CT CCAT 1154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1410 CCTGAT GACT GT GGCT CT GCT CCT GCTGGAGCGAGT TCCAGCCATGAGCT ACGT CT CCAT 14 69 

Qy 1155 TGTGGCCATCTTTGGCTTCGTGGCATTTTTTGAGATTGGCCCTGGCCCCATTCCTTGGTT 1214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1470 TGTGGCCATCTTTGGCTTCGTGGCATTTTTTGAGATTGGCCCTGGCCCCATTCCTTGGTT 1529 

Qy 1215 CATCGTGGCC GAGCT CTTCAGCCAGGGACCCCGCCCGGCAGC CAT GGCTGTGGCTGGTTT 1274 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 

Db 1530 CAT C GT GGCC GAGCT CT T CAGCCAGGGACC CC GC C C GGCAGCC AT GGCT GT GGC TGGT TT 158 9 

Qy 1275 CT CC AACT GGAC GAGC7AACTT CAT CAT T GGC AT GGGTT T C C AGT AT GT T GCGGAGGCT AT 1334 

I I 1 1 I M I I I II II I I I I 1 1 I I I I I I 1 1 I I II I I II 1 1 I I I I 1 1 1 1 1 1 1 1 I II I I I I I I I 

Db 1590 CT CC AACT GGAC GAGC AACTT CAT CAT T GGC AT GGGTT T C C AGT AT GT T GCGGAGGCT AT 164 9 

Qy 1335 GGGGCC CT AC GT CT T C CTTCTATTT GCGGT CC TC CT GCT GGGCTT CTT C AT CTT CACCTT 1394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I 
Db 1650 GGGGCCCTACGTCTTCCTTCTATTTGCGGTCCTCCTGCTGGGCTTCTTCATCTTCACCTT 1709 

Qy 1395 CTTAAGAGTACCTGAAACTCGAGGCCGGACGTTTGACCAGATCTCAGCTGCCTTCCACCG 14 54 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1710 CTTAAGAGTACCTGAAACTCGAGGCCGGACGTTTGACCAGATCTCGGCTGCCTTCCACCG 1769 

Qy 1455 GACACCCTCTCTTTTAGAGCAGGAGGTGAAACCCAGCACAGAACTTGAGTATTTAGGGCC 1514 
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IIIIIMIIIIIIIII llllllll II I MINI Illllll 

Db 1770 GACACC CT CT CT TT T AGAGC AGGAGGT GAAAC CC AGC AC AGAAC T T GAGT AT TT AGGGCC 182 9 

Qy 1515 AGAT GAGAACGAC 1527 

I I I I I I I I I III 
Db 1830 AGAT GAGAAT GAC 1842 
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RESULT 14 
ABL41106 

ID ABL41106 standard; DNA; 2592 BP. 
XX 

AC ABL41106; 
XX 

DT 12-AUG-2002 {first entry) 
XX 

DE Modified GLUT 4 encoding nucleotide sequence. 
XX 

KW Protein translocation; plasma membrane; GLUT-4; diabetes mellitus; 

KW insulin; gene; GFP; green fluorescent protein; ds . 

XX 

OS Synthetic. 
XX 

FH Key Location/Qualifiers 

FT CDS 1. .2592 

FT /*tag= a 

FT /product= "modified GLUT 4 " 

FT /note= "contains myc epitope tags and GFP" 

FT misc_feature 1873. .2592 

FT /*tag= b 

FT /note- "GFP" 

XX 

PN US2002052012-A1. 
XX 

PD 02-MAY-2002. 
XX 

PF 28-JUN-2001; 2001US-00894 927 . 
XX 

PR 22-MAY-1997; 97US-00474 33P . 

PR 09-JUN-1999; 99US-01 38237P . 

PR 15-SEP-1999; 99US-01 54078P . 

PR 09-JUN-2000; 2000US-00591025 . 
XX 

PA (WHED ) WHITEHEAD INST BIOMEDICAL RES. 
XX 

PI Bogan JS, Lodish HF; 
XX 

DR WPI; 2002-443696/47. 

DR P-PSDB; ABB07975. 
XX 

PT Determining protein translocation to the plasma membrane of a mammalian 

PT cell using a modified protein with an intracellular fluorescent tag and 

PT an extracellular group tag, useful in finding new drugs, particularly to 

PT treat diabetes. 
XX 

PS Example 1; Fig 8a-b; 34pp; English. 
XX 

CC The invention relates to determining if a protein translocates from an 

CC intracellular location to the plasma membrane of a. mammalian cell in the 

CC presence of a condition or stimulus. The method involves modifying the 

CC protein with a group tag in the extracellular domain and a fluorescent 

CC tag in the intracellular domain and determining the proportion of total 

CC protein which is at the membrane. The method is used to identify a drug 

CC which enhances translocation of a protein from an intracellular location 

CC to the plasma membrane of a mammalian cell. The method is particularly 

CC used to measure GLUT-4 protein translocation to identify drugs to treat 

CC insulin resistance in adult-onset diabetes mellitus. The invention 

CC provides a less labour intensive quantitative method for measuring GLUT 4 

CC translocation than prior art methods. The present sequence represents a 

CC modified GLUT 4 nucleotide sequence, containing myc epiotpe tags and green 

CC fluorescent protein (GFP) sequences 
XX 

SQ Sequence 2592 BP; 545^A^WLC; 733 G; 547 T; 0 U; 0 Other; 



Query Match / 86.6%; ^core 1325; DB 6; Length 2592; 

Best Local Similarity/ 99.6%; yPred. No. 3.2e-314; 

Matches 1328; Conservative SO; Mismatches 5; Indels 0; Gaps 0; 

GCCTGAGGGACCCAGCTCCATCCCTCCAGGCACCCTCACCACCCTCTGGGCCCTCTCCAT 254 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I 
GCTTAAGGGACCCAGCTCCATCCCTCCAGGCACCCTCACCACCCTCTGGGCCCTCTCCGT 569 

GGCCATCTTTTCCGTGGGCGGCATGATTTCCTCCTTCCTCATTGGTATCATCTCTCAGTG 314 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCCATCTTTTCCGTGGGCGGCATGATTTCCTCCTTCCTCATTGGTATCATCTCTCAGTG 629 

GCT T GGAAGGAAAAGGGC CATGCT GGTC AAC AAT GT CCT GGCGGT GCT GGGGGGC AGC CT 374 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I 




Qy 


195 


Db 


510 


Qy 


255 


Db 


570 


Qy 


315 


Db 


630 
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Qy 37 5 CATGGGCCTGGCCAACGCTGCTGCCTCCTATGAAATGCTCATCCTTGGACGATTCCTCAT 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 690 CATGGGCCTGGCCAACGCTGCTGCCTCCTATGAAATGCTCATCCTTGGACGATTCCTCAT 

Qy 435 T GGC GC CT ACT C AGGGCT GACAT C AGGGCT GGT GCC CAT GT AC GT GGGGGAGAT T GCT C C 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I II I I I I I I I I 
Db 750 T GGC GC CT ACT C AGGGCT GACAT C AGGGCT GGT GCC CAT GT ACGT GGGGGAGAT T GCT CC 

Qy 495 CACTCACCTGCGGGGCGCCCTGGGGACGCTCAACCAACTGGCCATTGTTATCGGCATTCT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 810 CACT CACC TGCGGGGC GC CCTGGGGACGCT CAACCAAC T GGC CAT T GT TAT C GGC ATT CT 

Qy 555 GATCGCCCAGGTGCTGGGCTTGGAGTCCCTCCTGGGCACTGCCAGCCTGTGGCCACTGCT 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 870 GATCGCCCAGGTGCTGGGCTTGGAGTCCCTCCTGGGCACTGCCAGCCTGTGGCCACTGCT 

Qy 615 CCTGGGCCTCACAGTGCTACCTGCCCTCCTGCAGCTGGTCCTGCTGCCCTTCTGTCCCGA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 930 CCTGGGCCTCACAGTGCTACCTGCCCTCCTGCAGCTGGTCCTGCTGCCCTTCTGTCCCGA 

Qy 67 5 GAGCCCCCGCTACCTCTACATCATCCAGAATCTCGAGGGGCCTGCCAGAAAGAGTCTGAA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M I ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 

Db 990 GAGCCCCCGCTACCTCTACATCATCCAGAATCTCGAGGGGCCTGCCAGAAAGAGTCTGAA 

Qy 735 GC GC CT GACAGGCT GGGC CGAT GT T T CT GGAGT GCT GGCT GAGCT GAAGGAT GAGAAGC G 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I II I I I I I I I 
Db 1050 GC GC CT GACAGGCT GGGC CGAT GT TT CT GGAGT GCT GGCT GAGCT GAAGGAT GAGAAGC G 

Qy 795 GAAGCT GGAGCGT G AGCGGC CACT GT CCCT GCT C GAGCT C CT GGGC AGCC GT AC CC AC C G 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1110 GAAGCT GGAGCGT GAGC GGC CACT GT CCCT GCT C C AGCT C CT GGGC AGCC GT AC CC AC C G 

Qy 855 GC AGC C CC T GAT CATT GC GGT C GT GCT GC AGCT GAGC C AGCAGCT CT C T GGC AT C AAT GC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1170 GC AGCC CC TGAT CATT GC GGT C GT GCT GC AGCT GAGCC AGC AGCT CT C TGGC AT C AAT GC 

Qy 915 T GTT T T CT AT T ATT CGAC CAGC AT CT T CGAGACAGC AGGGGT AGGC C AGC CT GC CT AT GC 

I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I 
Db 1230 TGTTTTCTATTATTCGACCAGCATCTTCGAGACAGCAGGGGTAGGCCAGCCTGCCTATGC 

Qy 97 5 CACC AT AGGAGC T GGT GT GGT C AACACAGT CT T C AC CT T GGT CT C GGT GT TGT T GGT GGA 

I I I I 1 1 I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1290 CACC AT AGGAGC T GGT GT GGT C AACACAGT CT T C AC CT T GGT CT CGGT GT TGT T GGT GGA 

Qy 1035 GCGGGCGGGGCGCCGGACGCTCCATCTCCTGGGCCTGGCGGGCATGTGTGGCTGTGCCAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1350 GCGGGCGGGGCGCCGGACGCTCCATCTCCTGGGCCTGGCGGGCATGTGTGGCTGTGCCAT 

Qy 1095 CCTGAT GACT GT GGCTCT GCTCCT GCTGGAGC GAGT TCCAGCCAT GAGCT ACGT CTCC AT 

I I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I 
Db 1410 CCT GAT GACT GT GGCT CT GCT C CT GCT GGAGC GAGT TC CAGC CAT GAGCT AC GT CT C C AT 

Qy 1155 TGTGGCCATCTTTGGCTTCGTGGCATTTTTTGAGATTGGCCCTGGCCCCATTCCTTGGTT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1470 TGTGGCCATCTTTGGCTTCGTGGCATTTTTTGAGATTGGCCCTGGCCCCATTCCTTGGTT 

Qy 1215 CAT C GT GGCC GAGCT CTT CAGC CAGGGAC CCC GC CC GGC AGCC AT GGCTGTGGC T GGT TT 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1530 CATCGTGGCCGAGCTCTTCAGCCAGGGACCCCGCCCGGCAGCCATGGCTGTGGCTGGTTT 

Qy 127 5 CTCC AACT GGACGAGC AACTTCAT CATTGGCAT GGGTTTC CAGT AT GT TGCGGAGGCT AT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1590 CT CC AACT GGAC GAGC AACT T CAT CATT GGCAT GGGTT TC CAGT AT GT TGCGGAGGCT AT 

Qy 1335 GGGGCCCT ACGT CTTCCTTCTATTTGCGGTCCTCCT GCT GGGCTTCTTCATCTTCACCTT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I i I I I I I I I I 
Db 1650 GGGGCCCT ACGT CTTCCTTCTATTTGCGGTCCTCCTGCTGGGCTTCTTCATCTTCACCTT 

Qy 1395 CTTAAGAGTACCTGAAACTCGAGGCCGGACGTTTGACCAGATCTCAGCTGCCTTCCACCG 

I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1710 CTTAAGAGTACCTGAAACTCGAGGCCGGACGTTTGACCAGATCTCGGCTGCCTTCCACCG 

Qy 1455 GACACCCT CT CT TTT AGAGCAGGAGGTGAAACCCAGCACAGAACTT GAGTATTT AGGGCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1770 GACACCCT CTCTTTTAGAGCAGGAGGTGAAACCCAGCACAGAACTT GAGTATTT AGGGCC 

Qy 1515 AGAT GAGAAC GAC 1527 

I I I I I I I I I III 
Db 1830 AGAT GAGAAT GAC 1842 
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RESULT 8 
CQ730609 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 



JOURNAL 



FEATURES 

source 



ORIGIN 



CQ730609 2129 bp DNA 

Sequence 16543 from Patent WO02068579. 
CQ730609 

CQ730609. 1 GI : 4 2304 929 



(human) 



linear PAT 03-FEB-2004 



Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini; 
Hominidae; Homo. 
1 

Venter, C. J., Adams,M.C, Li,P.W. and Myers, E.W. 
Kits, such as nucleic acid arrays, comprising a majority of 
humanexons or transcripts, for detecting expression and other uses 
thereof t 
Patent WO 020 8579-A 16543 06-S EP-2 002; 0V\V"^ QV^^j 



16543 
1US) 



PE Corpora ri"on (NTT 

Location/ Qualifiers 
1. .2129 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



Query Match 99.8%; 
Best Local Similarity 99.9%; 
Matches 1528; Conservative 



Score 1526.8; DB 6; Length 2129; 
Pred. No. 2.8e-313; 
0; Mismatches 2; Indels 



0; Gaps 



Qy 


1 


Db 


146 


Qy 


61 


Db 


206 


Qy 


121 


Db 


266 


Qy 


181 


Db 


326 


Qy 


241 


Db 


386 


Qy 


301 


Db 


446 


Qy 


361 


Db 


506 


Qy 


421 


Db 


566 


Qy 


481 


Db 


626 


Qy 


541 


Db 


686 


Qy 


601 


Db 


746 


Qy 


661 


Db 


806 


Qy 


721 


Db 


866 



AT GCCGT CGGGCTT CCAACAGATAGGCT CC GAAGAT GGGGAACCCCCT CAGC AGCGAGTG 
I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I II I I I I I II I I I I I i I I I I I I I I I I I I I I 
ATGCCGTCGGGCTTCCAACAGATAGGCTCCGAAGATGGGGAACCCCCTCAGCAGCGAGTG 



60 



205 



120 



AC T GGGAC CCT GGT CC TT GC T GT GT T CT CT GC GGTGCT T GGCT CCCT GCAGT TT GGGT AC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I 
ACTGGGACCCTGGTCCTTGCTGTGTTCTCTGCGGTGCTTGGCTCCCTGCAGTTTGGGTAC 2 65 

AACATT GGGGT CAT CAAT GCCCCT CAGAAGGT GATT GAAC AGAGCT ACAATGAGACGT GG 180 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
AACATT GGGGTC AT CAAT GCCCCT CAGAAGGT GATT GAACAGAGCT AC AATGAGACGT GG 325 

CTGGGGAGGCAGGGGCCTGAGGGACCCAGCTCCATCCCTCCAGGCACCCTCACCACCCTC 240 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CT GGGGAGGC AGGGGC CT GAGGGACCCAGC T C CATC CCT C C AGGCAC C CT CACC AC CC T C 385 

TGGGCCCTCTCCATGGCCATCTTTTCCGTGGGCGGCATGATTTCCTCCTTCCTCATTGGT 300 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
TGGGCCCTCTCCGTGGCCATCTTTTCCGTGGGCGGCATGATTTCCTCCTTCCTCATTGGT 4 45 

AT CAT CT CT C AGT GGC TT GGAAGGAAAAGGGC CATGCT GGT C AACAAT GT CCT GGC GGT G 360 

I I 1 1 I I I I I I I I I I I I 1 1 1 1 I I I I I I I I I I I I 1 1 1 1 1 1 1 1 1 I I I 1 1 M 1 1 1 1 1 1 1 1 I I I I 

AT C AT CT C T C AGT GGC TT GGAAGGAAAAGGGC CATGCT GGT C AACAAT GT CCT GGC GGT G 505 

CTGGGGGGCAGCCTCATGGGCCTGGCCAACGCTGCTGCCTCCTATGAAATGCTCATCCTT 4 20 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
CTGGGGGGCAGCCTCATGGGCCTGGCCAATGCTGCTGCCTCCTATGAAATGCTCATCCTT 565 

GGACGATTCCTCATTGGCGCCTACTCAGGGCTGACATCAGGGCTGGTGCCCATGTACGTG 4 80 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGACGATT CCT CAT T GGC GCCT ACT CAGGGCT GACATC AGGGCTGGTGCCCATGTACGT G 625 

GGGGAGATTGCTCCCACTCACCTGCGGGGCGCCCTGGGGACGCTCAACCAACTGGCCATT 540 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGGAGATTGCTCCCACTCACCTGCGGGGCGCCCTGGGGACGCTCAACCAACTGGCCATT 685 

GTTATCGGCATTCTGATCGCCCAGGTGCTGGGCTTGGAGTCCCTCCTGGGCACTGCCAGC 600 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

GT TAT C GGCATT CT GAT C GC CC AGGT GCT GGGCT TGGAGT CCCT CCT GGGC ACT GC C AGC 745 

CTGTGGCCACTGCTCCTGGGCCTCACAGTGCTACCTGCCCTCCTGCAGCTGGTCCTGCTG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CT GT GGCC ACT GCT CCTGGGCC TC AC AGT GCT AC CT GC CCT CCT GC AGCT GGTC CT GC T G 805 

CCCTTCTGTCCCGAGAGCCCCCGCTACCTCTACATCATCCAGAATCTCGAGGGGCCTGCC 720 
I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCTTCTGTCCCGAGAGCCCCCGCTACCTCTACATCATCCAGAATCTCGAGGGGCCTGCC 865 

AGAAAGAGT CT GAAGC GCCT GACAGGCT GGGC CGAT GT TT CT GGAGT GCT GGCT GAGCT G 780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGAAAGAGT CT GAAGC GC CT GACAGGCT GGGCCGAT GT TT CT GGAGT GCT GGCT GAGCT G 925 
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Qy 781 AAGGAT GAGAAGCGGAAGCT GGAGCGTGAGCGGCCACT GT CCCT GCTCCAGCTCCT GGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 926 AAGGATGAGAAGCGGAAGCT GGAGCGTGAGCGGCCACT GTCCCT GCTCCAGCTCCT GGGC 985 

Qy 841 AGCCGTACCCACCGGCAGCCCCTGATCATTGCGGTCGTGCTGCAGCTGAGCCAGCAGCTC 900 

I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I 

Db 98 6 AGCCGTACCCACCGGCAGCCCCTGATCATTGCGGTCGTGCTGCAGCTGAGCCAGCAGCTC 104 5 

Qy 901 T CTGGC AT CAAT GCT GT T T T CT AT T ATT CGACC AGC AT CT T CGAGACAGC AGGGGT AGGC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 104 6 TCTGGC AT CAAT GCT GT T TT CT AT T ATT CGACC AGC AT CT T C GAGACAGC AGGGGT AGGC 1105 

Qy 961 CAGCCT GCCT AT GCCACCAT AGGAGCTGGT GT GGTC AACACAGT CT TC ACCTT GGT CT CG 1020 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1106 CAGCCT GCCT AT GCCACCAT AGGAGCTGGT GT GGTC AACACAGT CT TC ACCTT GGT CT CG 1165 

Qy 1021 GT GT T GTT GGT GGAGC GGGC GGGGCGCC GGACGCTC CAT CT CCT GGGC CT GGCGGGCATG 1080 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1166 GT GT T GTT GGT GGAGC GGGC GGGGCGCC GGAC GC T C CAT C T CCT GGGC CT GGCGGGCATG 1225 

Qy 1081 T GTGGC T GT GCC AT CCT GAT GACT GT GGCT CT GC T C CT GC T GGAGC GAGT T C C AGC CATG 1140 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 122 6 TGTGGCTGTGCCATCCTGATGACTGT GGCT CTGCTCCTGCTGGAGCGAGTTCCAGC CATG 1285 

Qy 1141 AGCTACGTCTCCATTGTGGCCATCTTTGGCTTCGTGGCATTTTTTGAGATTGGCCCTGGC 1200 

I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1286 AGCTACGTCTCCATTGTGGCCATCTTTGGCTTCGTGGCATTTTTTGAGATTGGCCCTGGC 1345 

Qy 1201 CCCATTCCTTGGTTCATCGTGGCCGAGCTCTTCAGCCAGGGACCCCGCCCGGCAGCCATG 1260 

I I I I I I II I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1346 CCCATTCCTTGGTTCATCGTGGCCGAGCTCTTCAGCCAGGGACCCCGCCCGGCAGCCATG 1405 

Qy 1261 GCTGT GGCT GGT TT CT CC AACT GGAC GAGC AACT T C AT CAT T GGC ATGGGTT T CC AGT AT 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I 
Db 1406 GCTGTGGCTGGTTTCTCCAACTGGACGAGCAACTTCATCATTGGCATGGGTTTCCAGTAT 1465 

Qy 1321 GTTGCGGAGGCTATGGGGCCCTACGTCTTCCTTCTATTTGCGGTCCTCCTGCTGGGCTTC 1380 

I I I I I I I I I I I II I I I I I I I i I I I I II I I 1 I I I I I I I I I I I I I I I I I I I II I II I I I I I I 
Db 14 66 GTTGCGGAGGCTATGGGGCCCTACGTCTTCCTTCTATTTGCGGTCCTCCTGCTGGGCTTC 1525 

Qy 1381 TT CAT CTTCACCTT CT T AAGAGTACCTGAAACTC GAGGCC GGACGT TT GACC AGAT CT CA 144 0 

I I I I I I I I I I I ! II I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 152 6 TT CAT CTTCACCTTCTTAAGAGTACCTGAAACTC GAGGCC GGAC GTTT GACC AGAT CTCA 1585 

Qy 1441 GCTGCCTTCCACCGGACACCCTCTCTTTTAGAGCAGGAGGTGAAACCCAGCACAGAACTT 1500 

I I I I I I I I I I I I I II I I I I I I I I I I I ! I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1586 GCTGCCTTCCACCGGACACCCTCTCTTTTAGAGCAGGAGGTGAAACCCAGCACAGAACTT 164 5 

Qy 1501 GAGT AT TT AGGGCC AGAT GAGAAC GACT GA 1530 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 164 6 GAGT ATTT AGGGCC AGAT GAGAAC GACT GA 167 5 
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